Close

1. Identity statement
Reference TypeConference Video (Audiovisual Material)
Sitemtc-m16c.sid.inpe.br
Identifier8JMKD3MGPDW34P/43HC39E
Repositorysid.inpe.br/mtc-m16c/2020/11.05.16.41
Last Update2020:11.05.16.41.12 (UTC) simone
Metadata Repositorysid.inpe.br/mtc-m16c/2020/11.05.16.41.12
Metadata Last Update2021:09.16.19.16.55 (UTC) simone
Citation KeySilvaJúnior:2020:AbInCi
TitleO KNN e o desafio do Titatnic: uma abordagem introdutória da ciência de dados
FormatOn-line.
Year2020
Access Date2024, Apr. 27
Secondary TypePRE CN
Number of Files1
Size23906 KiB
2. Context
AuthorSilva Júnior, Antonio Carlos da
AffiliationUniversidade Federal do Paraná (UFPR)
Author e-Mail Addressjuniorssz@gmail.com
Conference NameWorkshop dos Cursos de Computação Aplicada do INPE, 20 (WORCAP)
Conference LocationSão José dos Campos
Date8-11 e 14-17 set. 2020
PublisherInstituto Nacional de Pesquisas Espaciais (INPE)
Publisher CitySão José dos Campos
Book TitleVídeos
Tertiary Typepalestra
History (UTC)2020-11-09 17:35:27 :: simone -> administrator :: 2020
2020-11-26 14:06:24 :: administrator -> simone :: 2020
2020-11-27 17:53:41 :: simone -> administrator :: 2020
2021-03-29 22:55:28 :: administrator -> simone :: 2020
3. Content and structure
Is the master or a copy?is the master
Content Stagecompleted
Transferable1
AbstractA ciência de dados é uma área de estudo multidisciplinar que tem se tornado cada vez mais popular entre as empresas de todo o planeta. Esta área tem como principal objetivo a extração de informações relevantes à partir de dados brutos, visando o melhor apoio à tomada de decisão. Esta ciência lida com técnicas estudadas há décadas, que vem ganhando destaque nos últimos anos em virtude do aumento da capacidade computacional para o processamento de um grande volume de dados que tem praticamente dobrado a cada ano. Estes dados são obtidos a partir de diversas fontes, como bancos de dados transacionais, redes sociais e dispositivos IOT, por exemplo. Contudo, eles necessitam de alguma intervenção profissional para a detecção e a eliminação de inconsistências, de modo a possibilitar as melhores e mais confiáveis análises. Dada a popularidade da ciência de dados entre as empresas e a dificuldade de se formar um profissional com boa capacitação nos pilares da ciência da computação, estatística / matemática e conhecimento de negócio, a demanda pelo cientista de dados no mercado de trabalho tem aumentado cada vez mais e, em consequência, o interesse pelo ingresso nesta nova profissão tem sido cada vez maior. O desafio do Titanic, promovido pela Kaggle que é uma plataforma que hospeda competições de ciência de dados, normalmente é a porta de entrada dos aspirantes a cientista de dados para o mundo da modelagem preditiva. No entanto, a falta dos recursos adequados para lidar com a etapa de preparação dos dados acaba comprometendo o sucesso da análise. Portanto, a proposta deste trabalho é uma abordagem por meio do conjunto de dados do desafio do Titanic, ao qual será demonstrada a etapa de tratamento e preparação dos dados com a utilização da linguagem de alto nível R apoiada pelo algoritmo KNN para a imputação de dados ausentes. Com a aplicação destas técnicas, além da obtenção de um conjunto de dados lapidado para aplicação da análise preditiva requerida pelo desafio, pode-se constatar que a abordagem é viável e plausível para ser aplicada em situações do mundo real, uma vez que os dados obtidos pelas empresas, mesmo em contexto e dimensões diferentes, muitas vezes são apresentados de forma semelhante. Este estudo tem o propósito de mostrar de maneira lúdica a importância de uma boa análise exploratória e do tratamento dos dados levantados, podendo assim auxiliar a Academia em estudos futuros, bem como orientar e incentivar os novos profissionais.
AreaCOMP
Typetecnologia da informação
Arrangement 1urlib.net > BDMCI > Fonds > WORCAP > O KNN e...
Arrangement 2urlib.net > BDMCI > Fonds > WORCAP > XX WORCAP > O KNN e...
Arrangement 3urlib.net > BDMCI > Fonds > Produção anterior à 2021 > LABAC > XX WORCAP > O KNN e...
doc Directory Contentaccess
source Directory Contentthere are no files
agreement Directory Contentthere are no files
4. Conditions of access and use
data URLhttp://urlib.net/ibi/8JMKD3MGPDW34P/43HC39E
zipped data URLhttp://urlib.net/zip/8JMKD3MGPDW34P/43HC39E
Languagept
Target FileKNN e desafio do Titanic_ Abordagem introdutória da ciência de dados - Antonio C. da Silva Jr.mp4
User Groupsimone
Visibilityshown
Copyright Licenseurlib.net/www/2012/11.12.15.03
Read Permissionallow from all
Update Permissionnot transferred
5. Allied materials
Mirror Repositoryiconet.com.br/banon/2005/09.28.12.40
Next Higher Units8JMKD3MGP8W/38ELNHL
8JMKD3MGPDW34P/43LA7CL
Host Collectionsid.inpe.br/mtc-m18@80/2008/03.17.15.17
6. Notes
Notes(15 min)
Empty Fieldsarchivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi e-mailaddress group holdercode isbn issn keywords label lineage mark nextedition numberofslides orcid parameterlist parentrepositories previousedition previouslowerunit progress project readergroup resumeid rightsholder schedulinginformation secondarydate secondarykey secondarymark session shorttitle sponsor subject tertiarymark url versiontype volume
7. Description control
e-Mail (login)simone
update 


Close